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(§) Dialogsteuerung fiir elektrisches Gerat 

(57) Bine Vorrichtung mit Mittein zur Aufnahme und Erken- 
nung von Sprachsignalen und ein Verfahren zur Steue- 
rung eines elektrischen Gerats werden vorgestellt. Die 
Vorrichtung welst ein Verkorperungselement 14 auf, das 
mechanisch bewegt werden kann. Die Position eines Be- 
nutzers wird ermittelt und das Verkorperungselement 14, 
das bspw. die Darstellung eines mensch lichen Gesichts 
umfassen kann, wird so bewegt, dass seine Vorderseite 
44 in Richtung der Position des Benutzers weist. Am Ver- 
korperungselement 14 konnen Mikrofone 16, Lautspre- 
cher 18 und/oder eine Kamera 20 vorgesehen sein. Der 
Benutzer kann einen Sprach-Dialog mit der Vorrichtung 
fiihren, wobei sich ihm das Gerat in Form des Verkorpe- 
rungselements 14 darstellt. Entsprechend der Sprachein- 
gaben des Benutzers kann ein elektrisches Gerat ange- 
steuert werden. Ebenso ist ein Dialog des Benutzers mit 
dem Verkorperungselement moglich, mit dem Ziel, den 
Benutzer zu unterrichten. 
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Beschreibung 

[0001] Die Erfindung betrifft eine Vorrichtung mit Mitteln 
zur Aufnahme und Erkennung von Sprachsignalen sowie 
ein Verfahren zur Kommunikation eines Benutzers mit ei- 5 
nem elektronischen Gerat. 

[0002] Es sind Spracherkennungsmittel bekannt, mit de- 

nen aufgenommenen akustischen Sprachsignalen das ent- 
sprechende Wort bzw. eine entsprechende Wortfolge zuge- 
ordnet werden kann. Spracherkennungssysteme werden - 10 
haufig als Dialogsysteme in Kombination mit Sprachsyn- 
these - zur Steuerung elektrischer Gerate eingesetzt. Hierbei 
kann ein Dialog mit dem Benutzer als alleinige Schnittstelle 
fiir die Bedienung des elektrischen Gerats genutzt werden. 
Ebenso ist es moglich, dass die Sprachein- und ggfs. auch - 15 
ausgabe als eines von mehreren Kommunikationsmitteln ge- 
nutzt wird. 

[0003] In der US-A-6,118,888 ist eine Steuervorrichtung 
und ein -verfahren zur Steuerung eines elektrischen Gerats, 
bspw. eines Computers oder eines Gerats der Unterhaltungs- 20 
elektronik beschrieben. Fiir die Steuerung des Gerats stehen 
dem Benutzer eine Anzahl von EingabemogHchkeiten zur 
Verfiigung. Dies umfasst mechanische EingabemogHchkei- 
ten wie Tastatur oder Maus ebenso wie Spracherkennung. 
Zusatzlich verfiigt das Steuergerat iiber eine Kamera, mit 25 
der Gestik und Mimik des Benutzers aufgenommen werden 
konnen, die als weitere Eingabesignale verarbeitet werden. 
Die Kommunikation mit dem Benutzer erfolgt in Form ei- 
nes Dialogs, wobei dem System auch eine Anzahl von We- 
gen zur Verfiigung stehen, um dem Benutzer Informationen 30 
zu iibermitteln. Dies umfasst Sprachsynthese und -ausgabe. 
Insbesondere umfasst dies auch eine anthropomorphe Re- 
prasentation, bspw. eine Darstellung eines Menschen, eines 
menschlichen Gesichts oder eines Tieres. Diese Reprasenta- 
tion wird dem Benutzer in Form einer Computergraphik auf 35 
einem Bildschinn gezeigt. 

[0004] Wahrend Dialogsysteme in speziellen Anwendun- 
gen - bspw. in Telefon-Auskunftssystemen - heute bereits 
eingesetzt werden, ist in anderen Bereichen - bspw. Steue- 
rung von elektrischen Geraten im Haushalt, Unterhaltungs- 40 
elektronik - die Akzeptanz noch gering. 
[0005] Es ist Aufgabe der Erfindung, eine Vorrichtung mit 
Mitteln zur Aufnahme zur Erkennung von Sprachsignalen 
sowie ein Bedien verfahren fiir ein elektronisches Gerat vor- 
zuschlagen, bei dem einem Benutzer die Bedienung mittels 45 
Sprachsteuerung besonders leicht fallt. 
[0006] Diese Aufgabe wird gelost durch eine Vorrichtung 
nach Anspruch 1 und ein Verfahren nach Anspruch 11. Ab- 
hangige Anspriiche beziehen sich auf vorteilhafte Ausfiih- 
rungsformen der Erfindung. 50 
[0007] Die erfindungsgemaBe Vorrichtung weist ein me- 
chanisch bewegbares Verkorperungselement auf. Hierbei 
handelt es sich um einen Teil der Vorrichtung, der fiir den 
Benutzer als Verkorperung eines Dialogpartners dient. Die 
konkrete Ausgestaltung eines solchen Verkorperungsele- 55 
ments kann sehr verschieden ausf alien. Bspw. kann es sich 
um einen Gehauseteil handeln, der gegeniiber einem Stand- 
gehause eines elektrischen Gerats motorisch beweglich an- 
geordnet ist. MaBgeblich ist, dass das Verkorperungsele- 
ment eine fiir den Benutzer als solche erkennbare Vorder- 60 
seite aufweist. Ist diese Vorderseite dem Benutzer zuge- 
wandt, so wird ihm hierdurch der Eindruck vermittelt, dass 
das Gerat "aufmerksam" ist, d. h. Sprachkommandos entge- 
gennehmen kann. 

[0008] ErfindungsgemaB verfiigt die Vorrichtung iiber 65 
Mittel zur Bestinmiung der Position eines Benutzers. Dies 
kann bspw. iiber akustische oder optische Sensoren erfol- 
gen. Die Bewegungsmittel des Verkorperungselements wer- 
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den so angesteuert, dass die Vorderseite des Verkorperungs- 
elements in Richtung der Position des Benutzers weist. So 
hat der Benutzer stets den Eindruck, dass die Vorrichtung 
bereit ist, ihm "zuzuhoren". 

[0009] GemaB einer Weiterbildung der Erfindung umfasst 
das Verkorperungselement eine anthropomorphe Darstel- 
lung. Hierbei kann es sich um eine Darstellung eines Men- 
schen oder eines Tieres, aber auch um eine Phantasiefigur 
(bspw. ein Roboter) handeln. Bevorzugt wird eine Darstel- 
lung eines menschlichen Gesichts. Hierbei kann es sich um 
eine realistische oder auch lediglich symboHsche Darstel- 
lung handeln, bei der bspw. lediglich die Umrisse sowie Au- 
gen, Nase und Mund dargestellt sind. 
[0010] Bevorzugt wird, dass die Vorrichtung auch Mittel 
zur Ausgabe von Sprachsignalen umfasst. Fiir die Steuerung 
eines elektronischen Gerats ist zwar vor allem die Spracher- 
kennung maBgeblich. Riickmeldungen, Bestatigungen, 
Nachfragen etc. konnen jedoch mit Sprachausgabemitteln 
realisiert werden. Dies kann die Wiedergabe vorgespeicher- 
ter Sprachsignalen ebenso wie echte Sprachsynthese umfas- 
sen. Mit Sprachausgabemitteln kann eine vollstandige Dia- 
logsteuerung realisiert sein. Es konnen auch Dialoge mit 
dem Benutzer gefiihrt werden, um diesen zu unterhalten. 
[0011] GemaB einer Weiterbildung der Erfindung umfasst 
die Vorrichtung eine Anzahl von Mikrofonen und/oder min- 
destens eine Kamera. Die Aufnahme von Sprachsignalen 
kann bereits mit einem einzigen Mikrofon erreicht werden. 
Bei der Verwendung von mehreren Mikrofonen kann aber 
einerseits eine Richtcharakteristik erreicht werden. Anderer- 
seits ist durch Empfang des Sprachsignals eines Benutzers 
mit mehreren Mikrofonen auch eine Ortung der Position des 
Benutzers moglich. Mit einer Kamera kann die Umgebung 
des Gerats beobachtet werden. Durch entsprechende Bild- 
verarbeitung kann aus dem aufgenommenen Bild ebenfalls 
die Position des Benutzers ermittelt werden. Die Mikrofone, 
die Kamera und/oder Lautsprecher zur Ausgabe von 
Sprachsignalen konnen am mechanisch beweglichen Ver- 
korperungselement angebracht sein. Bspw. bei einem Ver- 
korperungselement, dass einem menschlichen Kopf nachge- 
bildet ist, konnen im Bereich der Augen zwei Kameras, an- 
stelle des Mundes ein Lautsprecher und im Bereich der Oh- 
ren zwei Mikrofone angeordnet sein. 

[0012] Bevorzugt wird, dass Mittel zur Identifikation ei- 
nes Benutzers vorgesehen sind. Dies kann bspw. durch Aus- 
wertung eines aufgenonmienen Bildsignals (Gesichtserken- 
nung) oder durch Auswertung des aufgenonamenen akusti- 
schen Signals (Sprechererkennung) erreicht werden. Hier- 
mit kann die Vorrichtung aus einer Anzahl von Personen, die 
sich in der Umgebung aufhalten, den jeweils aktuellen Be- 
nutzer ermitteln und das Verkorperungselement auf diesen 
Benutzer ausrichten. 

[0013] Fiir die Bewegungsmittel zur mechanischen Bewe- 
gung des Verkorperungselementes gibt es die verschieden- 
sten Moglichkeiten. Bspw. konnen diese Mittel Elektromo- 
toren oder hydraulische Stellmittel umfassen. Das Verkorpe- 
rungselement kann auch durch die Bewegungsmittel fortbe- 
wegt werden. Bevorzugt wird jedoch, dass das Verkorpe- 
rungselement gegeniiber einem feststehenden Teil lediglich 
schwenkbar ist. Hierbei sind bspw. Schwenkbewegungen 
um eine horizontale und/oder vertikale Achse moglich. 
[0014] Die erfindungsgemaBe Vorrichtung kann Teil eines 
elektrischen Gerats sein. Hierbei kommen bspw. Gerate der 
Unterhaltungselektronik (z. B. TV, Abspielgerate fiir Audio- 
und/oder Video etc.) in Frage. Die Vorrichtung stellt in die- 
sem Fall die Benutzerschnittstelle fiir das Gerat dar. Zusatz- 
lich kann das Gerat auch iiber andere Bedienungsmittel (Ta- 
statur etc.) verfiigen. Altemativ kann die erfindungsgemaBe 
Vorrichtung auch ein eigenstandiges Gerat sein, das als 
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Steuervorrichtung zur Steuerung eines oder mehrerer sepa- 
rater elektrischer Gerate dient. In diesem Fall verfugen die 
zu steuemden Gerate iiber einen elektrischen Steueran- 
schluss (z. B. drahtlos oder iiber einen geeigneten Steuer- 
bus), iiber den die Vorrichtung die Gerate entsprechend der 5 
vom Benutzer entgegengenommenen Sprachkommandos 
steuert. 

[0015] Insbesondere kann die erfindungsgemaBe Vorrich- 
tung fiir den Benutzer als Schnittstelle eines Systems zur 
Datenablage und/oder Abfrage dienen. Hierfiir sind in der 10 
Vorrichtung interne Datenspeicher vorhanden oder die Vor- 
richtung ist - bspw. iiber ein Computer-Netzwerk oder das 
Internet - an exteme Datenspeicher angebunden. Im Dialog 
kann der Benutzer Daten ablegen (z. B. Telefonnummem 
speichem, Memos ablegen etc.) oder Daten abfragen (bei- 15 
spielsweise Uhrzeit, Nachrichten, das aktuelle Femsehpro- 
gramm etc.). 

[0016] Darliber hinaus konnen die Dialoge mit dem Be- 
nutzer auch genutzt werden, um Parameter der Vorrichtung 
selbst einzustellen und deren Konfiguration zu andem. 20 
[0017] Wenn ein Lautsprecher zur Ausgabe und ein Mi- 
krofon zur Aufnahme von akustischen Signalen vorgesehen 
sind, so kann eine Signalverarbeitung mit Storunterdriik- 
kung vorgesehen sein, d. h. eine Verarbeitung der aufge- 
nommenen akustischen Signale so, dass Anteile des vom 25 
Lautsprecher ausgehenden akustischen Signals unterdriickt 
werden. Dies ist insbesondere vorteilhaft, wenn Lautspre- 
cher und Mikrofon in raumlicher Nahe, bspw. am Verkorpe- 
rungselement angebracht sind. 

[0018] Zusatzlich zur oben angegebenen Verwendung der 30 
Vorrichtung zur Steuerung eines elektrischen Gerats kann 
diese auch zur Fiihrung eines Dialogs mit dem Benutzer ver- 

wendet werden, der anderen Zwecken, bspw. der Informa- 
tion, Unterhaltung oder Unterrichtung des Benutzers dient. 
GemaB einer Weiterbildung der Erfindung sind Dialogmittel 35 
vorgesehen, mit denen ein Dialog zur Unterrichtung des Be- 
nutzers gefuhrt werden kann. Der Dialog lauft dann bevor- 
zugt so ab, dass dem Benutzer Aufgaben gestellt und seine 
Antworten aufgenonmien werden. Bei den Aufgaben kann 
es sich um komplexe Fragestellungen handeln, bevorzugt 40 
wird aber ein Abfragen von kurzen Lerngegenstanden wie 
bspw. Vokabeln einer fremden Sprache, bei denen Aufgabe 
(bspw.: Definition eines Wortes) und Antwort (bspw.: Wort 
in der Fremdsprache) relativ kurz sind. Der Dialog wird 
vom Benutzer mit dem Verkorperungselement gefiihrt und 45 
kann visuell und/oder per Audio erfolgen. 
[0019] Als eine MogUchkeit einer effektiven Lemme- 
thode wird vorgeschlagen, dass ein Satz von Lerngegenstan- 
den (bspw.: Vokabeln einer Fremdsprache) gespeichert sind, 
wobei fiir jeden Lemgegenstand mindestens gespeichert ist 50 
eine Aufgabe (bspw.: Definition), eine Losung (bspw.: Vo- 
kabel) und eine MaBzahl fiir die Zeitdauer seit der letzten 
Stellung der Aufgabe an den Benutzer bzw. der korrekten 
Losung der Aufgabe durch diesen. Wahrend des Dialogs 
werden nun nacheinander Lerngegenstande ausgewahlt und 55 
abgefragt, indem die Aufgabe dem Benutzer gestellt und die 
Antwort des Benutzers mit der gespeicherten Losung vergli- 
chen wird. Die Auswahl des jeweils abzufragenden Lemge- 
genstands beriicksichtigt hierbei die gespeicherte MaBzahl, 
d. h. die seit der letzten Abfrage des Gegenstands vergan- 60 
gene Zeit. Dies kann bspw. iiber ein geeignetes Lemmodell 
mit einer angenommenen oder ermittelten Vergessensrate 
erfolgen. Zusatzlich kann jeder Lemgegenstand auch mit ei- 
ner Relevanz-MaBzahl bewertet sein, wobei die Relevanz- 
MaBzahl zusatzlich zur Zeitdauer-MaBzahl bei der Auswahl 65 
beriicksichtigt wird. 

[0020] Nachfolgend werden Ausfuhrungsformen der Er- 
findung anhand von Zeichnungen naher beschrieben. Hier- 
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bei zeigen: 

[0021] Fig, 1 ein Blockdiagramm von Elementen einer 
Steuervorrichtung; 

[0022] Fig. 2 eine perspektivische DarsteUung eines elek- 
trischen Gerats mit einer Steuervorrichtung. 
[0023] Fig. 1 zeigt in einem Blockdiagramm eine Steuer- 
vorrichtung 10 und ein hierdurch angesteuertes Gerat 12. 
Die Steuervorrichtung 10 tritt fiir den Benutzer durch ein 
Verkorperungselement 14 in Erscheinung. Am Verkorpe- 
rungselement 14 sind ein Mikrofon 16, ein Lautsprecher 18 
und ein Positions sensor fiir die Position eines Benutzers, 
hier in Form einer Kamera 20 angebracht. Gemeinsam bil- 
den diese Elemente eine mechanische Einheit 22. Das Ver- 
korperungselement 14 und damit die mechanische Einheit 
22 wird durch einen Motor 24 um eine vertikale Achse ver- 
schwenkt. Eine zentrale Steuereinheit 26 steuert iiber eine 
Ansteuerschaltung 28 den Motor 24 an. Das Verkorperungs- 
element 14 ist eine eigenstandige mechanische Einheit. Es 
weist eine fiir den Benutzer als solche erkennbare Vorder- 
seite auf . Mikrofon 16, Lautsprecher 18 und Kamera 20 sind 
am Verkorperungselement 14 in Richtung dieser Vorderseite 
angebracht. 

[0024] Das Mikrofon 16 liefert ein akustisches Signal. 
Dieses wird von einem Auftiahmesystem 30 aufgenommen 

und durch eine Spracherkennungseinheit 32 bearbeitet. Das 
Ergebnis der Spracherkennung, d. h. die dem aufgenomme- 
nen akustischen Signal zugeordnete Wortfolge wird an die 
zentrale Steuereinheit 26 geleitet. 

[0025] Die zentrale Steuereinheit 26 steuert auch eine 
Sprachsyntheseeinheit 34 an, die ein synthetisches Sprachsi- 
gnal iiber eine Tonerzeugungseinheit 36 und den Lautspre- 
cher 18 ausgibt. 

[0026] Das von der Kamera 20 aufgenommene Bild wird 
von der Bildverarbeitungseinheit 38 verarbeitet. Die Bild- 
verarbeitungseinheit 38 emiittelt aus dem von der Kamera 
20 gelieferten Bildsignal den Standort eines Benutzers. Die 
Standortinformation wird an die zentrale Steuereinheit 26 
iibermittelt. 

[0027] Die mechanische Einheit 22 dient als Benutzer- 
schnittstelle, iiber die die zentrale Steuereinheit 26 Eingaben 
des Benutzers entgegennimmt (Mikrofon 16, Spracherken- 
nungseinheit 32) und Riickmeldungen an den Benutzer gibt 
(Sprachsyntheseeinheit 34, Lautsprecher 18). Die Steuerein- 
heit 10 dient hierbei zur Steuerung eines elektrischen Gerats 
12, bspw. eines Gerats aus dem Bereich der Unterhaltungs- 
elektronik. 

[0028] Die DarsteUung der Steuervorrichtung 10 in Fig. 1 
zeigt lediglich symbolisch deren Funktionseinheiten. Die 
verschiedenen Einheiten, bspw. zentrale Steuereinheit 26, 
Spracherkennungseinheit 32, Bildverarbeitungseinheit 38 

konnen in einer konkreten Umsetzung als separate Baugrup- 
pen vorhanden sein. Ebenso ist aber eine rein softwarema- 
Bige Implementation dieser Einheiten denkbar, wobei die 
FunktionaUtat von mehreren oder alien dieser Einheiten 
durch ein auf einer Zentraleinheit ablaufendes Programm 
realisiert wird. 

[0029] Ebenso ist es nicht zwingend, dass sich diese Ein- 
heiten in raumlicher Nahe zueinander oder zur mechani- 

schen Einheit 22 befinden. Die mechanische Einheit 22, 
d. h. das Verkorperungselement 14 so wie auch die bevor- 
zugt, aber nicht zwingend daran angeordneten Einheiten Mi- 
krofon 16, Lautsprecher 18 und Sensor 20, konnen entfemt 
vom Rest der Steuervorrichtung 10 separat angeordnet sein 
und lediglich - leitungsgebunden oder auch drahtlos - in Si- 
gnalverbindung hiermit stehen. 

[0030] Im Betrieb der Steuervorrichtung 10 wird standig 
ermittelt, ob sich ein Benutzer in der Umgebung aufhalt. Die 

Position des Benutzers wird emiittelt. Die zentrale Steuer- 
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einheit 26 steuert den Motor 24 so an, dass die Vorderseite 
des Verkorperungselements 10 in Richtung des Benutzers 
weist. 

[0031] Die Bildverarbeitungseinheit 38 umfasst auch eine 
Gesichtserkennung. Liefert die Kamera 20 ein Bild mit 5 
mehreren Personen, so wird mit Hilfe der Gesichtserken- 
nung ermittelt, welche der Personen der - dem System be- 
kannte - Benutzer ist. Das Verkorperungselement 14 wird in 
Richtung dieses Benutzers ausgerichtet. Sind mehrere Mi- 
krofone vorhanden, so konnen die Signale dieser Mikrofone 10 
so verarbeitet werden, dass eine Richtcharakteristik in Rich- 
tung der bekannten Position des Benutzer entsteht. 
[0032] Die Bildverarbeitungseinheit 38 kann zusatzlich so 
ausgestaltet sein, dass sie die durch die Kamera 20 aufge- 
nommene Szene in der Umgebung der mechanischen Ein- 15 
heit 22 "versteht". Die jeweilige Szene kann dann einer von 
einer Anzahl vordefinierten Zustande zugeordnet werden. 
Bspw. ist der zentralen Steuereinheit 26 auf diese Weise be- 
kannt, ob eine oder mehrere Personen im Rauin sind. Die 
Einheit kann auch bspw. das Verhalten des Benutzers erken- 20 
nen und zuordnen, d. h. z. B. ob der Benutzer in Richtung 
der mechanischen Einheit 22 blickt oder ob er sich im Ge- 
sprach mit einer anderen Person befindet. Durch Auswer- 
tung der so erkannten Zustande kann die Erkennungslei- 
stung deutlich verbessert werden. Bspw. kann vemiieden 25 
werden, dass Teile eines Gesprachs zwischen zwei Personen 
irrtiimlich als Sprachkommandos interpretiert werden. 
[0033] Die zentrale Steuereinheit ermittelt in einem Dia- 
log mit dem Benutzer Eingaben und steuert das Gerat 12 
entsprechend an. Ein solcher Dialog zur Steuerung der Laut- 30 
Starke eines Audio- Wiedergabegerats 12 kann bspw. wie 
folgt ablaufen: 

- Der Benutzer wendet sich von seinem jeweiligen 
Standort dem Verkorperungselement 14 zu. Das Ver- 35 
korperungselement 14 ist durch den Motor 24 stets so 
gerichtet, dass seine Vorderseite dem Benutzer zuge- 
wandt ist. Hierfur wird die Ansteuerschaltung 28 von 
der zentralen Steuereinheit 26 des Gerats 10 entspre- 
chend der ermittelten Position des Benutzers angesteu- 40 
ert. 

- Der Benutzer gibt ein Sprachkommando, bspw. 
"Lautstarke Femseher". Das Sprachkommando wird 
vom Mikrofon 16 aufgenommen und durch die Sprach- 
erkennungseinheit 32 erkannt. 45 

- Die zentrale Steuereinheit 26 reagiert mit einer 
Ruckfrage: "Lauter oder leiser?", die iiber die Sprach- 
syntheseeinheit 34 vom Lautsprecher 18 ausgegeben 
wird. 

- Der Benutzer gibt das Sprachkommando "Leiser". 50 

Nach Erkennung des Sprachsignals steuert. die zentrale 
Steuereinheit 26 das Gerat 12 so an, dass die Lautstarke 
verringert wird. 

[0034] Fig, 2 zeigt eine perspektivische Darstellung eines 55 
elektronischen Gerats 40 mit einer integrierten Steuervor- 
richtung. Von der Steuervorrichtung 10 ist hier nur das Ver- 
korperungselement 14 zu sehen, das gegenuber einem 
Standgehause 42 des Gerats 40 um eine vertikale Achse ver- 
schwenkbar ist. In diesem Beispiel ist das Verkorperungs- 60 
element von flacher, rechteckiger Form. Auf der Vorderseite 
44 befindet sich das Objektiv der Kamera 20 sowie der Laut- 
sprecher 18. Seitlich sind zwei Mikrofone 16 angeordnet. 
Durch einen Motor (nicht dargestellt) wird die mechanische 
Einheit 22 stets so gedreht, dass die Vorderseite in Richtung 65 
des Benutzers zeigt. 

[0035] In einer Ausfiihrungsform (nicht dargestellt) wird 
die Vorrichtung 10 aus Fig. 1 nicht zur Steuerung des Gerats 
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12, sondem zur Fiihrung eines Dialogs mit dem Ziel der Un- 
terrichtung eines Benutzers verwendet. Die zentrale Steuer- 
einheit 26 fiihrt hierbei ein Lemprogramm aus, mit dessen 
Hilfe der Benutzer eine Fremdsprache erlemen kann. 
[0036] In einem Speicher ist ein Satz von Lemgegenstan- 
den abgespeichert. Hier handelt es sich um einzelne Daten- 
satze, von denen jeder die Definition eines Wortes, das ent- 
sprechende Wort in der Fremdsprache, eine Bewertungs- 
MaBzahl fur die Relevanz des Wortes (Auftretenshaufigkeit 
des Wortes in der Sprache) und eine Zeit-MaBzahl fur die 
Dauer der seit der letzten Abfrage des Datensatzes vergan- 
gene Zeit aufweist. 

[0037] Eine Lemeinheit im Dialog lauft nun ab, indem 
nacheinander Datensatze ausgewahlt und abgefragt werden. 
Hierbei wird dem Benutzer eine Aufgabe gestellt, d. h. die 
in dem Datensatz gespeicherte Definition optisch angezeigt 
oder akustisch ausgegeben. Die Antwort des Benutzers, 
bspw. eingegeben iiber eine Tastatur, bevorzugt aufgenom- 
men iiber das Mikrofon 16 und die automatische Spracher- 
kennung 32 wird aufgenommen und mit der gespeicherten 
Losung (Vokabel) verglichen. Der Benutzer wird dariiber in- 
formiert, ob die Losung als richtig erkannt wurde. Fiir den 
FaU fehlerhafter Antworten kann dem Benutzer die richtige 
Losung mitgeteilt oder zuvor ein- oder mehrmals Gelegen- 
heit zur weiteren Antwort gegeben werden. Nach derartiger 
Abarbeitung des Datensatzes wird die abgespeicherte MaB- 
zahl fiir die Zeitdauer seit der letzten Abfrage aktualisiert, 
d. h. auf Null gesetzt. 

[0038] Danach erfolgt die Auswahl und Abfrage eines 
weiteren Datensatzes usw.. 

[0039] Die Auswahl der jeweils abzufragenden Daten- 
satze erfolgt anhand eines Gedachtnismodells. Ein einf aches 
Gedachtnismodell ware die Formel 

P(k) = exp(-t(k) • r(c(k))), 

wobei P(k) die Wahrscheinlichkeit bezeichnet, dass der 
Lemgegenstand k bekannt ist, exp die Exponentialfunktion 
bezeichnet, t(k) die Zeit bezeichnet, seit der Gegenstand zu- 
letzt abgefragt wurde, c(k) die Lem-Klasse des Gegenstan- 
des ist und r(c(k)) die lemklassen-spezifische Vergessens- 
rate. Fiir t kann die Uhrzeit verwendet werden. Ebenso kann 
die Zeit t in Lemschritten gerechnet werden. Lem-Klassen 
konnen auf verschiedene geeignete Arten definiert werden. 
Ein mogliches Modell ist es, fiir jedes N > 0 alle Gegen- 
stande die N mal richtig beantwortet wurden einer entspre- 
chenden Klasse zuzuordnen. Fiir die Vergessensrate kann 
ein geeigneter fester Wert angenommen werden, oder es 
kann ein geeigneter Startwert ausgewahlt und bspw. durch 
einen Gradienten-Algorithmus adaptiert werden. 
[0040] Ziel der Unterrichtung ist eine Maximierung eines 
WissensmaBes. Dieses WissensmaB wird definiert als der 
Anteil der dem Benutzer bekannten Lemgegenstande des 
Satzes, gewichtet mit der Relevanz-MaBzahl. Da die Ab- 
frage eines Gegenstandes k die Wahrscheinlichkeit P(k) auf 
Eins bringt, wird zur Optimierung der M^ssens-MaBzahl 
vorgeschlagen, in jedem Schritt den Gegenstand mit der ge- 
ringsten Wissenswahrscheinlichkeit P(k), ggfs. gewichtet 
mit der Relevanz-MaBzahl U(k), U(k) • l-P(k)) abzufragen. 
Mit Hilfe des Modells kann die Wissens-MaBzahl nach je- 
dem Schritt berechnet und dem Benutzer angezeigt werden. 
Die Methode ist daraufhin optimiert, dem Benutzer eine 
moglichst breite Kenntnis der Lemgegenstande des aktuel- 
len Satzes zu vermitteln. Durch Benutzung eines guten Ge- 
dachtnismodells wird hierbei eine effektive Lemstrategie er- 
zielt. 

[0041] Zu dem geschilderten Abfrage-Dialog sind eine 
Anzahl von Abwandlungen und Erweiterungen denkbar. So 
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kann es bspw. zu einer Frage (Definition) mehrere richtige 
Antworten (Vokabeln) geben. Dies kann beriicksichtigt wer- 
den, bspw. indem die gespeicherten Relevanz-MaBzahlen 
herangezogen werden und so die relevanteren (haufigeren) 
Worte starker betont werden. Die jeweiligen Satze von 5 
Lemgegenstanden konnen bspw. mehrere tausend Worte 
umfassen. Hierbei kann es sich bspw. um Lem-Gegen- 
stande, d. h. Fachvokabular fiir eine bestimmte Benutzung, 
bspw. im Bereich der Literatur, Geschaftsleben, Technik etc. 
handeln. 10 
[0042] Die Erfindung lasst sich dahingehend zusammen- 
f as sen, dass eine Vorrichtung mit Mitteln zur Aufnahme und 
Erkennung von Sprachsignalen und ein Verfahren zur Kom- 
munikation mit einem elektrischen Gerat vorgestellt wer- 
den. Die Vorrichtung weist ein Verkorperungselement auf, 15 
das mechanisch bewegt werden kann. Die Position eines Be- 
nutzers wird ermittelt und das Verkorperungselement, das 
bspw. die Darstellung eines menschlichen Gesichts umfas- 
sen kann, wird so bewegt, dass seine Vorderseite in Rich- 
tung der Position des Benutzers weist. Am Verkorperungs- 20 
element konnen Mikrofone, Lautsprecher und/oder eine Ka- 
mera vorgesehen sein. Der Benutzer kann einen Sprach-Dia- 
log mit der Vorrichtung fuhren, wobei sich ihm das Gerat in 
Form des Verkorperungselements darstellt. Entsprechend 
der Spracheingaben des Benutzers kann ein elektrisches Ge- 25 
rat angesteuert werden. Ebenso ist ein Dialog des Benutzers 
mit dem Verkorperungselement moglich mit dem Ziel, den 
Benutzer zu unterrichten. 

Patentanspriiche 30 

1. Vorrichtung mit 

Mitteln zur Aufnahme und Erkennung von Sprachsi- 
gnalen (30, 32) 

und einem Verkorperungselement (14) mit einer Vor- 35 
derseite (44) und Bewegungsmitteln (24) zur mechani- 
schen Bewegung des Verkorperungselements (14), 
wobei Mittel (38) zur Bestimmung der Position eines 
Benutzers vorhanden sind, 

und die Bewegungsmittel (24) so angesteuert werden, 40 
dass die Vorderseite (44) des Verkorperungselements 
(14) in Richtung der Position des Benutzers weist. 

2. Vorrichtung nach Anspruch 1, bei der 

Mittel (34, 36, 18) zur Ausgabe von Sprachsignalen 
vorgesehen sind. 45 

3. Vorrichtung nach einem der vorangehenden An- 
spriiche, bei der 

das Verkorperungselement (14) eine anthropomorphe 
Darstellung, 

insbesondere eine Darstellung eines menschlichen Ge- 50 

sichts umfasst. 

4. Vorrichtung nach einem der vorangehenden An- 
spriiche, bei der 

eine Anzahl von Mikrofonen (16) und/oder mindestens 
eine Kamera (20) vorgesehen sind, 55 
wobei bevorzugt die Mikrofone (16) und/oder die Ka- 
mera (20) am Verkorperungselement (14) angebracht 
sind. 

5. Vorrichtung nach einem der vorangehenden An- 
sprliche, bei der 60 
Mittel zur Identifikation mindestens eines Benutzers 
vorgesehen sind. 

6. Vorrichtung nach einem der vorangehenden An- 
spriiche, bei der 

die Bewegungsmittel (24) ein Schwenken des Verkor- 65 
perungselements (14) um mindestens eine Schwenk- 
achse ermoglichen. 

7. Vorrichtung nach einem der vorangehenden An- 
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spriiche, bei der 

mindestens ein extemes elektrisches Gerat (12) vorge- 
sehen ist, das durch die Sprachsignale gesteuert wird. 

8. Vorrichtung nach einem der vorangehenden An- 
spriiche, bei der 

mindestens ein Lautsprecher (18) zur Ausgabe von 
akustischen Signalen, 

und mindestens ein Mikrofon (16) zur Aufnahme von 
akustischen Signalen vorgesehen ist, 
wobei eine Signalverarbeitungseinheit (30) zur Verar- 
beitung der aufgenommenen akustischen Signale vor- 
gesehen ist, wobei Anteile des Signals, die auf vom 
Lautsprecher (18) ausgegebene akustische Signale zu- 
riickgehen, unterdriickt werden. 

9. Vorrichtung nach einem der vorangehenden An- 

spriiche, bei der 

Mittel zur Fiihrung eines Dialogs zur Unterrichtung ei- 
nes Benutzers vorgesehen sind, 

wobei in dem Dialog dem Benutzer visuell und/oder 
per Audio Aufgaben gestellt werden, und die Antwor- 
ten des Benutzers mittels einer Tastatur und/oder durch 
ein Mikrophon aufgenommen werden. 

10. Vorrichtung nach Anspruch 9, bei der 

die Dialogmittel Speichermittel fiir einen Satz von 
Lemgegenstanden umfassen, 

wobei fiir jeden Lerngegenstand mindestens eine Auf- 
gabe, eine Losung und eine MaBzahl fiir die Dauer seit 
einer Bearbeitung der Aufgabe durch den Benutzer ge- 
speichert sind, 

und wobei die Dialogmittel so ausgebildet sind, dass 
Lemgegenstande ausgewahlt und abgefragt werden, in- 
dem die Aufgabe dem Benutzer gestellt und die Ant- 
wort des Benutzers mit der gespeicherten Losung ver- 
glichen werden, 

wobei bei der Auswahl der Lemgegenstande die ge- 
speicherte MaBzahl beriicksichtigt wird. 

1 1 . Verfahren zur Kommunikation eines Benutzers mit 
einem elektrischen Gerat (12), bei dem 

die Position eines Benutzers ermittelt wird, 

und ein Verkorperungselement (14) so bewegt wird, 

dass eine Vorderseite (44) des Verkorperungselements 

(14) in Richtung des Benutzers weist, 

und Sprachsignale des Benutzers aufgenommen und 

verarbeitet werden. 

12. Verfahren nach Anspruch 11, bei dem 
entsprechend der aufgenommenen Sprachsignale das 
elektrische Gerat (12) gesteuert wird. 
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